On the Effectiveness of Parameter-Efficient Fine-Tuning

نویسندگان

چکیده

Fine-tuning pre-trained models has been ubiquitously proven to be effective in a wide range of NLP tasks. However, fine-tuning the whole model is parameter inefficient as it always yields an entirely new for each task. Currently, many research works propose only fine-tune small portion parameters while keeping most shared across different These methods achieve surprisingly good performance and are shown more stable than their corresponding fully fine-tuned counterparts. such kind still not well understood. Some natural questions arise: How does sparsity lead promising performance? Why models? choose tunable parameters? In this paper, we first categorize existing into random approaches, rule-based projection-based approaches based on how they which tune. Then, show that all actually sparse conduct novel theoretical analysis them. We indicate imposing regularization original by controlling upper bound stability. Such stability leads better generalization capability empirically observed lot recent works. Despite effectiveness grounded our theory, remains open problem parameters. do utilize task-specific data information suffer from projection discontinuity problem. To parameters, Second-order Approximation Method (SAM) approximates with analytically solvable optimization function. The determined directly optimizing approximation extensive experiments several experimental results proposed SAM outperforms strong baseline also verifies analysis. source code paper can obtained https://github.com/fuzihaofzh/AnalyzeParameterEff\/icientFinetune .

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

a study on the effectiveness of textual modification on the improvement of iranian upper-intermediate efl learners’ reading comprehension

این پژوهش به منظور بررسی تأثیر اصلاح متنی بر بهبود توانایی درک مطلب زبان آموزان ایرانی بالاتر از سطح میانی انجام پذیرفت .بدین منظور 115 دانشجوی مرد و زن رشته مترجمی زبان انگلیسی در این پزوهش شرکت نمودند.

Efficient and Robust Parameter Tuning for Heuristic Algorithms

The main advantage of heuristic or metaheuristic algorithms compared to exact optimization methods is their ability in handling large-scale instances within a reasonable time, albeit at the expense of losing a guarantee for achieving the optimal solution. Therefore, metaheuristic techniques are appropriate choices for solving NP-hard problems to near optimality. Since the parameters of heuristi...

متن کامل

a study on the effectiveness of task types (noticing-reformulation) on iranian low intermediate efl learners’ retention of collocations

چکیده پژوهش شبه تجربی حاضر به بررسی بکارگیری تمارین کلاسی که برانگیزنده آگاهی و توجه آگاهانه به همایندها بعنوان بخشی از یک دوره ی مکالمه زبان خارجی در یکی از آموزشگاه های زبان انگلیسی ایران است می پردازد.

Face Detection by Fine Tuning the Gabor Filter Parameter

Face detection technique recognition is developed by using and fine tuning the Gabor Wavelet parameters. An extensive study of these parameters have been made and checked on a large acquired data set of face images, for extracting the features. The Facial data consists of 320 frontal face 180 non-face images. (Total=500 images) Artificial Neural Network is then used on the extracted features fo...

متن کامل

survey on the rule of the due & hindering relying on the sheikh ansaris ideas

قاعده مقتضی و مانع در متون فقهی کم و بیش مستند احکام قرار گرفته و مورد مناقشه فقهاء و اصولیین می باشد و مشهور معتقند مقتضی و مانع، قاعده نیست بلکه یکی از مسائل ذیل استصحاب است لذا نگارنده بر آن شد تا پیرامون این قاعده پژوهش جامعی انجام دهد. به عقیده ما مقتضی دارای حیثیت مستقلی است و هر گاه می گوییم مقتضی احراز شد یعنی با ماهیت مستقل خودش محرز گشته و قطعا اقتضاء خود را خواهد داشت مانند نکاح که ...

15 صفحه اول

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Proceedings of the ... AAAI Conference on Artificial Intelligence

سال: 2023

ISSN: ['2159-5399', '2374-3468']

DOI: https://doi.org/10.1609/aaai.v37i11.26505